3 research outputs found

    Mise en forme du bruit de codage dans la norme G.722.1 ITU-T

    Get PDF
    Le projet dĂ©crit dans ce mĂ©moire traite de la mise en forme du bruit de codage dans la norme G.722.1 ITU-T. Cette Ă©tude a deux volets: d'une part, il s'agit d'incorporer trois techniques de mise en forme du bruit dans la norme G.722.1, Ă  savoir, le gauchissement frĂ©quentiel (frequency warping ), le fenĂȘtrage adaptatif ( windows switching ), et la mise en forme temporelle du bruit ( temporal noise shaping ), dans le but d'Ă©tudier l'effet de chaque modification sur la qualitĂ© de codage Ă  16 kbit/s des signaux Ă©chantillonnĂ©s Ă  16 kHz. L'autre volet du projet a pour objet la substitution de la quantification scalaire et du codage Huffman par une quantification vectorielle algĂ©brique. Une quantification sphĂ©rique se basant sur un rĂ©seau de Gosset Ă  8 dimensions, E[indice infĂ©rieur 8] , sera utilisĂ©e Ă  cet effet pour quantifier les coefficients du spectre gĂ©nĂ©rĂ©s dans la norme G.722.1. Cette application va tenter de rĂ©aliser un codage des signaux audio large bande (50 Hz-7 kHz) Ă  un taux binaire de 16 kbit/s

    New Trends in Biologically-Inspired Audio Coding

    Get PDF
    This book chapter deals with the generation of auditory-inspired spectro-temporal features aimed at audio coding. To do so, we first generate sparse audio representations we call spikegrams, using projections on gammatone or gammachirp kernels that generate neural spikes. Unlike Fourier-based representations, these representations are powerful at identifying auditory events, such as onsets, offsets, transients and harmonic structures. We show that the introduction of adaptiveness in the selection of gammachirp kernels enhances the compression rate compared to the case where the kernels are non-adaptive. We also integrate a masking model that helps reduce bitrate without loss of perceptible audio quality. We then quantize coding values using the genetic algorithm that is more optimal than uniform quantization for this framework. We finally propose a method to extract frequent auditory objects (patterns) in the aforementioned sparse representations. The extracted frequency-domain patterns (auditory objects) help us address spikes (auditory events) collectively rather than individually. When audio compression is needed, the different patterns are stored in a small codebook that can be used to efficiently encode audio materials in a lossless way. The approach is applied to different audio signals and results are discussed and compared. This work is a first step towards the design of a high-quality auditory-inspired \"object-based\" audio coder

    Mise en forme du bruit de codage dans la norme G.722.1 ITU-T

    No full text
    Le projet dĂ©crit dans ce mĂ©moire traite de la mise en forme du bruit de codage dans la norme G.722.1 ITU-T. Cette Ă©tude a deux volets: d'une part, il s'agit d'incorporer trois techniques de mise en forme du bruit dans la norme G.722.1, Ă  savoir, le gauchissement frĂ©quentiel (frequency warping ), le fenĂȘtrage adaptatif ( windows switching ), et la mise en forme temporelle du bruit ( temporal noise shaping ), dans le but d'Ă©tudier l'effet de chaque modification sur la qualitĂ© de codage Ă  16 kbit/s des signaux Ă©chantillonnĂ©s Ă  16 kHz. L'autre volet du projet a pour objet la substitution de la quantification scalaire et du codage Huffman par une quantification vectorielle algĂ©brique. Une quantification sphĂ©rique se basant sur un rĂ©seau de Gosset Ă  8 dimensions, E[indice infĂ©rieur 8] , sera utilisĂ©e Ă  cet effet pour quantifier les coefficients du spectre gĂ©nĂ©rĂ©s dans la norme G.722.1. Cette application va tenter de rĂ©aliser un codage des signaux audio large bande (50 Hz-7 kHz) Ă  un taux binaire de 16 kbit/s
    corecore